Loading...
机构名称:
¥ 1.0

从分子的图形表示中了解化学结构是一项具有挑战性的图像限制任务,它将极大地使以分子为中心的分数发现。分子图像和标题子任务中的变化在图像代表学习和任务建模中都构成了重大挑战。然而,现有的方法仅集中于将分子图像转化为其图形结构的特定字幕任务,即OCSR。 在本文中,我们提出了光学化学结构(OCSU)任务,该任务将OCSR扩展到分子图像字幕从基序级别到分子水平和抽象水平。 我们提出了两种方法,包括基于OCSR的方法和端到端OCSR-无ocsr方法。 拟议的双检查通过针对局部模棱两可的原子的细心功能增强,在现实世界专利和期刊媒介场景上实现了SOTA OCSR性能。 以基于微笑的分子理解方法级联,它可以利用OCSU的特定任务特定模型的功能。 MOL-VL是端到端优化的基于VLM的模型。 OCSU数据集Vis-Chebi20是基于广泛使用的Chebi20数据集构建的,用于培训和评估。 对Vis-Chebi20的广泛实验结果证明了所提出的方法的有效性。 提高OCSR功能可以为基于OCSR的APARCH提供更好的OCSU性能,而Mol-VL的SOTA性能表明了端到端方法的巨大潜力。OCSR。在本文中,我们提出了光学化学结构(OCSU)任务,该任务将OCSR扩展到分子图像字幕从基序级别到分子水平和抽象水平。我们提出了两种方法,包括基于OCSR的方法和端到端OCSR-无ocsr方法。拟议的双检查通过针对局部模棱两可的原子的细心功能增强,在现实世界专利和期刊媒介场景上实现了SOTA OCSR性能。以基于微笑的分子理解方法级联,它可以利用OCSU的特定任务特定模型的功能。MOL-VL是端到端优化的基于VLM的模型。OCSU数据集Vis-Chebi20是基于广泛使用的Chebi20数据集构建的,用于培训和评估。对Vis-Chebi20的广泛实验结果证明了所提出的方法的有效性。提高OCSR功能可以为基于OCSR的APARCH提供更好的OCSU性能,而Mol-VL的SOTA性能表明了端到端方法的巨大潜力。

arxiv:2501.15415v1 [cs.cv] 2025年1月26日

arxiv:2501.15415v1 [cs.cv] 2025年1月26日PDF文件第1页

arxiv:2501.15415v1 [cs.cv] 2025年1月26日PDF文件第2页

arxiv:2501.15415v1 [cs.cv] 2025年1月26日PDF文件第3页

arxiv:2501.15415v1 [cs.cv] 2025年1月26日PDF文件第4页

arxiv:2501.15415v1 [cs.cv] 2025年1月26日PDF文件第5页

相关文件推荐

2025 年
¥1.0
2024 年
¥1.0